大家好,我是伐伐伐伐木工
今天要與大家分享監控 Monitor,本篇內容的重點如下
監控可以幫助團隊觀察系統的效能並偵測已知的故障,有效的監控包含三個步驟
然而,監測也有其局限性。為了進行監控,您必須知道要追蹤哪些指標和日誌。如果您的團隊沒有預測到問題,則可能會錯過關鍵的生產故障和其他問題。
在現代分散式系統中,常見監控的元件有基礎建設、應用程式、資料庫、網路、資料流等,而我們想要的指標會因為監控類型而不同,例如
由 Brendan Gregg 提出文章,USE 方法是基於三種度量類型和處理複雜系統的策略,其縮寫代表意義如下
核心概念
對於每個資源,檢查使用率、飽和度和錯誤。
2015年,Grafana 的 Tom Wilkie 談到了監控微服務的RED方法。Tom 建議不要監視每個資源的使用率、飽和度和錯誤,而是對於每個資源,監控
核心概念
透過使用 RED 方法,公司將更了解客戶的滿意度,並將幫助您建立有意義的警報並衡量 SLA
來自 Google SRE Book : The Four Golden Signals
監控的四個黃金訊號是延遲、流量、錯誤和飽和度。如果您只能衡量使用者導向的系統的四個指標,請專注於這四個指標。
以上是今天的分享,如果有任何疑問或想法,歡迎留言提出討論 !
4 SRE Golden Signals (What they are and why they matter)
USE vs RED vs The Four Golden Signals